課程資訊
課程名稱
新聞資料處理與視覺呈現
Journalism Processing and Visualization 
開課學期
111-2 
授課對象
社會科學院  新聞研究所  
授課教師
謝吉隆 
課號
JOUR5014 
課程識別碼
342 U1250 
班次
 
學分
3.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四2,3,4(9:10~12:10) 
上課地點
新聞103 
備註
初選不開放。
限學士班三年級以上
總人數上限:40人
外系人數限制:20人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

請閱讀課綱後於第一次上課前晚前填寫修課意願
https://docs.google.com/document/d/16jtSKN7RQNMVa8gxsAANBHQg4juxr-EMWQETTLWCrQQ/edit?usp=sharing

本學期課綱與逐週課程內容請參考https://docs.google.com/document/d/16jtSKN7RQNMVa8gxsAANBHQg4juxr-EMWQETTLWCrQQ/edit?usp=sharing 

課程目標
本門課企圖訓練對新聞傳播有興趣的學生成為資料記者,將帶學生以R程式語言獲取資料、探索資料、與視覺化資料。本課程的核心教材將以紐約時報等國際媒體的資訊圖表為案例,透過查找資料,撰寫程式,來介紹資料與視覺化的後設思考,包含對於資料格式的認識、資料分布的介紹、視覺化準則、圖表的適當應用、甚至顏色適用性等。以國內外媒體為案例,使得程式教學能夠緊扣應用,是本門課的特色。可以期待在認真上過一學期的課後,已經能夠獨立獲取資料、操作資料、分析、視覺化並撰寫資料新聞,並精熟R在資料探索上的撰寫。 
課程要求
本課程的重點會是資料視覺化準則,但同時也要求在實務上學生必須以產製資料新聞為期末成品,並列為分數依據之一。因此,期待修課學生是對用資料說故事有興趣,而不只是跑圖表有興趣的學生,畢竟圖表要被適當詮釋才能夠發揮其敘事功能。本門課更鼓勵並將輔導同學修飾作品以投稿全球華文永續獎學生平面報導獎。 
預期每週課後學習時數
Office Hours
 
指定閱讀
1. 資料視覺化:製作充滿說服力的資訊圖表
(Online version: Fundamentals of Data Visualization)
2. R for Data Science (had.co.nz) 
參考書目
1. Text Mining with R | Text Mining with R (tidytextmining.com)
2. R for Data Science (had.co.nz)
3. Tidy Modeling with R (tmwr.org)
4. Supervised Machine Learning for Text Analysis in R (smltar.com) 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
Assignments 
45% 
It is expected that there will be 8~9 after-class exercises, and the submission time will be limited to one week to ensure that students can keep up with the progress. Overdue cannot be resubmitted. 
2. 
Data-Driven News Project 
30% 
The data-driven news project scoring includes 5% news novelty, 5% data use (you need to write a working report to explain how you clean the data), 5% programming (submission needed), 5% news writing, 5% visualization, 5% oral presentation. Data-driven journalism will emphasize the news itself, rather than data analysis, text mining, or visual interface design. We will invite domestic data journalists to rate and comment students' term projects. 
3. 
Data visualization meta-analysis 
15% 
 
4. 
Practices 
10% 
For asynchronous learning with pre-recorded videos (5%) and online learning platform Datacamp (5%) 
 
針對學生困難提供學生調整方式
 
上課形式
以錄影輔助
作業繳交方式
考試形式
其他
由師生雙方議定
課程進度
週次
日期
單元主題
第1週
2/23  Course overview
Using R and RStudio 
第2週
3/02  R Basic: vector and dataframe
Discovering data
Lab: Writing R Markdown 
第3週
3/09  Data-driven news report and chart presentation: NYT-WGOITH
R-Reading and filtering data-Paid maternity leave as an example 
第4週
3/16  Data format
Reading CSV: TP Theft and pivot analysis 
第5週
3/23  Tidyverse: From base to dplyr (Very important) 
第6週
3/30  Data manipulation: Joining data from different sources
WGOITH Review II 
第7週
4/06  Data Visualization with ggplot2
Visual principals 
第8週
4/13  Midterm 
第9週
4/20  Pitching
 
第10週
4/27  Data visualization II
Text processing (Document level) 
第11週
5/04  Web Scraping I with API 
第12週
5/11  Regular expression
Text Processing: Word level 
第13週
5/18  Web Scraping II: HTM Parsing 
第14週
5/25  Spatial data manipulation and Visualization 
第15週
6/01  Interaction and Animation with R 
第16週
6/08  Final report